查看原文
其他

冯海红、王鹏飞:加强公共数据全生命周期治理

加强公共数据全生命周期治理

冯海红 王鹏飞

    公共数据是数据资源体系的重要组成部分,公共数据治理是数据治理体系和治理能力建设的重中之重。在数字中国建设纵深推进的背景下,特别是《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》(简称“数据二十条”)发布以来,我国数据要素化和价值化进程加快,但是数据治理体系不健全、数据治理能力不足的问题越发凸显。如何加强公共数据治理、深挖公共数据价值,以公共数据引领释放数据要素潜能,成为亟待探索的重要课题。

公共数据治理是数智化发展的必然要求

 数据是数字化、网络化、智能化的基础,“数据二十条”中指出,公共数据是党政机关、企事业单位在依法履职或提供公共服务的过程中产生的数据。公共数据以其鲜明的公共性、规模性、多样性和权威性蕴藏着巨大价值。公共数据在数据资源大循环中发挥着引领作用,通过加强公共数据治理促进数据合规高效流通使用,对于加快数字经济创新发展、赋能国家治理现代化,具有重要战略意义。

 一是加快数字经济高质量发展的必然要求。数字经济的本质特征是数据驱动。我国是全球第二大数字经济体和数据资源大国,还不是数字经济强国和数据强国。2022年,美、德、英等发达国家数字经济占GDP比重均超过65%,而我国仅为41.5%。《全国数据资源调查报告(2023)》显示,我国数据生产总量达32.85ZB,却仅有2.9%被保存,而存储数据中约4成未被使用。大量数据因加工能力不够和管理不善而难以挖掘复用,数据治理能力不足成为制约数据价值化的主要瓶颈,迫切要求以公共数据治理为牵引,全面增强数据治理能力,将超大规模市场、海量数据资源、丰富应用场景等优势转化为高质量发展牵引力。

 二是数据赋能国家治理现代化的必然要求。数据治理是数字时代国家治理的应有之义。数据既是治理对象,又是治理手段。无论公共数据还是企业数据、个人数据,都面临着采集归集、确权授权、流通交易、开发利用、安全保护等全生命周期治理难题,也都依赖于借助数字技术和工具提高治理效能、推动治理创新。公共数据已被广泛应用于公共服务、社会管理、经济调节、环境保护、市场监管、城市运行管理等众多领域和场景,成为数字政府和数字社会建设的驱动力。要实现国家治理的数字化转型,就需要以公共数据治理为突破口,加快数据治理体系和治理能力现代化建设,推动形成数据驱动的政府决策与管理服务模式。

 三是应对生成式人工智能变革的必然要求。在决策式人工智能逐渐普及应用的同时,以大语言模型为代表的生成式人工智能取得突破性进展,为数智化变革带来更强大的工具。大数据、强算力、好算法是大模型的三要素,OpenAI公司的多模态大模型GPT4.0就拥有1.8万亿巨量参数,是用13万亿token数据训练而来,一次训练成本约6300万美元,需在2.5万个英伟达A100芯片上训练上百天。大模型训练涉及多源异构数据融合应用,不仅在公共数据搜集和数据治理方面投入巨大,而且会引发新的公共数据安全与合规风险。发展生成式人工智能,首先考验的是高质量数据有效供给、多源异构数据融合处理和公共数据安全保护等能力。

公共数据面临着全生命周期的治理挑战

 近年来,我国高度重视以政务数据为核心的公共数据管理应用,各地各部门积极探索实践,取得重要进展。政策法规方面,数据立法步伐加快,制度规则建设提速。截至2024年6月,全国至少出台地方数据条例10部、公共数据地方法规7部及政府规章40部,北京、上海、广东、浙江、山东、贵州等多地探索数据要素市场化配置改革。组织管理方面,初步形成上下联动、横向协同的统筹管理架构。国家数据局组建运行,31个省(区、市)和新疆生产建设兵团均完成机构组建,大部分省份配套设立大数据中心、组建数据集团,一些地区试点首席数据官制度。流通应用方面,共享开放初见成效,授权运营起步探索。一体化政务数据共享枢纽接入53个国家部门和全部省份数据,22个省份和200多个城市上线数据开放平台,4个国家部委和15个省份探索公共数据授权运营,公共数据场景应用和政企数据融合不断推进。

 然而,公共数据全生命周期治理仍存在诸多痛点难点和共性挑战,数据供给质量不高、共享开放不够、开发利用不足、安全保护不力等问题突出,面临确权授权、估值定价、流通交易、融合应用、市场监管等多重难题。去年,南方某市曾发布公告,以起拍价18亿元竞拍政务数据资源和智慧城市特许经营权,被舆论称为“政务数据第一拍”,但很快被叫停。地方政府推进数据资产价值化所带来的“数据财政”冲动也引发了广泛质疑。

 一是公共数据供给质量不高,数据资源体系还不健全。我国数据资源规模优势并不能掩盖数据质量不高、有效供给不足的现实,公共数据同样如此。公共数据资源整体呈现分散化、碎片化、无序化状态,内涵边界模糊,存在家底不清、权责不明、标准不一、统筹不力等问题,数据质量管理、目录和清单管理等有待加强,数据资产与数据知识产权登记均在探索阶段,全国统一的数据资源体系远未建成。

 二是公共数据共享开放不足,数据可信流通尚在探索。数据孤岛问题依然存在,互联互通梗阻亟待疏解。数据共享仅在少数场景得到满足,跨区域跨领域跨层级共享仍然困难;数据开放平台建设水平参差不齐,缺少全国统一的平台和标准;授权运营刚刚起步,相关法律依据、制度设计、程序规范、技术方案、收益分配等有待深化;公共数据空间等设施建设有待优化,公共数据的央地联动及部际协同机制亟须构建。

 三是公共数据开发利用不足,数据融合应用未及预期。目前,公共数据应用场景以公共服务和社会管理为主,多场景应用、多主体复用难度大,政企数据融合应用的广度和深度相对不足,面向人工智能的多源异构数据处理能力和算力水平难以满足需要。

 四是公共数据安全保护不力,数据市场监管存在短板。现有数据监管政策、机制和技术手段难以适应愈发严峻复杂的公共数据安全形势。数据分类分级安全管理制度尚未有效建立,数据安全风险评估分析、监测预警的智能平台及工具缺乏,数据沙箱等监管创新探索不够。

加强公共数据治理体系和治理能力建设

 公共数据治理需把握好供给和需求、政府和市场、效率和公平、发展和安全等重大关系。应当进一步完善国家数据战略,坚持技术、组织、制度、市场等多维发力,统筹推进公共数据全生命周期治理,加快构建公共数据供给、流通、应用、安全“四位一体”治理体系,形成符合数字化发展需要和国家治理现代化要求的公共数据治理能力。

 健全公共数据管理制度。完善政策法规,由国家数据局牵头制定公共数据管理条例或办法,协调各职能部门制定行业或领域数据管理规章,探索设立首席数据官等制度,细化落实公共数据分类分级、质量管理、目录及清单管理等制度。加强统筹管理,明晰数据主管部门、网信部门及相关部门机构的职责分工,协同打造一体化数据资源体系。健全标准规范,构建覆盖公共数据全生命周期的治理标准体系和贯标工作体系,研究将生成式人工智能技术用于公共数据治理的指导规范。

 创新公共数据流通模式。加强数据流通设施建设,充分运用区块链、隐私计算等可信流通技术,打造全国一体化的数据登记存证、共享开放、授权运营等平台体系,聚焦重点行业领域规划建设一批公共数据空间。深入推进公共数据共享开放,迭代升级全国一体化政务数据共享枢纽,加快推出国家公共数据开放平台,注意防范形式主义、地方主义倾向。组织开展公共数据授权运营试点,推进公共数据分类分级确权授权使用,探索公共数据估值定价、纳统入表、价格形成、收益分配等机制,支持集中授权、分散授权、分级授权、分场景授权等多种模式发展,引导地方国资数据集团发挥关键作用。

 深化公共数据融合应用。坚持场景驱动、需求牵引,结合“人工智能+”和“数据要素×”等行动计划,组织开展公共数据融合应用试点,围绕数字化发展重点领域分批打造典型场景,鼓励数据多场景应用、多主体复用,探索政企数据融合应用新模式。大力培育数据运营商、服务商和数据要素型企业,鼓励利用人工智能、多源异构数据融合等技术工具,基于公共数据开展科学研究、产品开发、数据加工、数据分析、咨询服务等创新创业活动。

 加强公共数据安全治理。切实加强数据分类分级安全管理和数据监管执法,筑牢公共数据安全屏障。完善监管机制,健全网信部门统筹、多部门协同的安全治理职能分工,明确数据主管部门的监管职责,健全公共数据联管联治、监督问责机制。创新监管方式,探索建立包容审慎、敏捷响应的监管政策体系,利用数字技术构建数据安全风险评估、监测预警、应急指挥等智能化平台、流程和机制,鼓励数据空间、数据沙箱等监管创新。统筹加强人工智能与数据安全治理,实施数据、算力、算法一体治理,依法打击公共数据相关违法违规行为。
 (作者分别系中国科学院科技战略咨询研究院大数据战略研究中心执行主任,中国科学技术大学国际金融研究院副研究员)

    来源:大众日报2024-08-07

继续滑动看下一个
大数据战略研究中心
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存